間 記 引 算 回 路 設計 の セン ス を 


つか も う 


演算 を ハー ドウ ェ ア 化 する 際 に どん な こ 


考え る か 


仕様 で 求め られ る 演算 処理 の 内 容 を 理解 で きる よう に な っ た 
ら , 今度 は 実際 に 回 路 に 落と し 込む 作業 に 入り ます . 本 策 で 
は , 回 路 化 に あたっ て 使わ れる 一 般 的 な 考え 方 や 設計 の コツ を 
説明 し ます . ほとん どの 実用 回 路 は ,。 それ ら の いずれ か , も し 
く は 複数 を 組み 合わ せる こと で 作ら れ て いま す . (著者 ) 


出力 デー タ 名 


作ろ うと する 図 
演算 回 路 較 


1. どの くら い の 性 能 に し た い の か ? 較 
* ターゲット ・ デ バイ ス は ? 図 
e ク ロッ ク 周 波数 は ? 図 
e ゃ デー タ の ビッ ト 幅 は ? 凶 
e デー タ 到来 の 間隔 は ? 凶 
e 処理 の レイ テン シ ( 遅延 ) は ? 図 
e 回 路 規模 は ? 
e 消費 電力 は ? 
2. 接続 先 は どの よう な 回 路 な の か ? 凶 
e CPU バス と つなぐ の か ? 図 
e* マ スタ ? スレーブ? 罰 
ゃ ほか の IP コア と 直接 つなぐ の か ? 
e ゃ イン ター フェ ー ス の 端子 や プロ ト コル は ? 図 
e 起動 と 停止 は 誰が 制御 する の か ? 凶 
3. 設計 の 環境 は ? 較 
* 何人 で 何 力 月 で 作る の か ? 較 
* どの 程度 の 品質 を 保証 する の か ? 図 
* ど ん な ツー ル を 使っ て 作る の か ? 図 
Na プ 
図 1 演算 回 路 の 本 体 を 作り 出す 前 に 大 ざっ ぱ で も 決め る べき こと 
演算 回 路 本 体 を さっ さと 作っ て 安心 し た く な る も の だ が , その 気持 ち を グッ 
と 抑え て , まず は 目標 性 能 や 接続 先 と の 交信 方 法 に つい て 決め る こと が 大 
事 . も ちろ ん , シス テム 開発 初期 で これ ら を 確定 的 に は 決め られ な か っ た 
り , 開発 中 に 変更 が 入っ た りす る こと も 多い が , 何 も 決 め な いよ り 後 か 
ら 回 路 を 全面 作り 直し 」 の リス ク を は る か に 低減 で きる . 


制御 用 出力 


回 路 本 体 を 
作っ て か ら 


よう と し て も 駄目 ! 
作る 前 に 決め る 


64 点 高速 フー リ 工 変換 FFT, テイ ラー 展開 , 


還 較 Word 
ーー ゴー イン ター リー ブ , 抽象 度 


と を 


条 岡 澄夫 


① まず は シス テム 全体 の こと を 考え る 


意外 に 思わ れる か も し れ ま せん が , 演算 回 路 だ か ら と 
いっ て 数 値 計算 本 体 か ら 設計 に 入っ つて いく わけ で は あり ま 
せん . どちら か と いえ ば それ は 後回し で す . 


人 @ 操 路 内 部 より も 先 に 目標 性 能 や I/F 仕様 を 考え る 

り 道 の よ う で も , シス テム 全体 の 中 で 回 路 が どう 使わ 

れる か を 考え , 回 路 の 目標 性 能 や 入出 力 イ ンタ ー フ ェ ー ス 

を は っ きり させ る と ころ か ら 入 り ま ず 15L 16 図 1, 図 2). 

これ は , ソフ トウ ェ ア を 複数 人 で 分 担 し て 作成 する よう な 
合 に , 例え ば 関数 の 中 身 を いき な り 作り 始め た り せ ず , 


回 


data 


valid 作ろ うと する 図 
sync 演算 回 路 較 
ready 


SynC ッッ 
ready ilWiWl | 


ゃ データ が どの よう な 間隔 , 順番 で 来る の か を 決め る 較 
( 必要 な ら , デー タ 順 を 示す 信号 も 追加 ) 図 

e デー タ 送受 信 の 同期 の 取り 方 を 決め る 図 

( この 例 の 通り で な く て も よい ) 図 


図 2 デー タ 転 送 プ ロト コル タイ ミン グ ・ チ ャ ー ト ) を 決め た 例 
プロ ト コル 設計 と いう と 難し そう だ が , 要 は デー タ を や り と りす る 端子 と タ 
イミ ング ・ チ ャ ー ト を 決め る と いう こと . 必ず し も この 図 通 り と は 限ら な い . 


オン ザ フ ラ イ 計 算 , 離散 コサイン 変換 ,、 パイ プラ イン , 
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入出 力 仕様 を まず 決め る の と 全く 同じ こと で す . 
すなわち , 

e どの くら い の 性 能 の 回 路 に し た い の か . 加え て , 使え る ク 
ロッ ク の 周波 数 や 本 数 は どの 程度 で 。 どれくらい の 回 路 規 
模 な ら 許 され る の か , どの よう な デバ イス を 使う の か 
( FPGA か ASIC か . ASIC な ら 何 nm の 製造 プロ セス か ) 

e 回 路 に 対す る デー タ の 入出 ガ タイ ミン グ ・ チ ャ ー ト や 
入出 力 の ビッ ト 幅 な ど ) を どの よう に する か 

どのくらい の 設 計 期 間 な の か 

な ど に つい て , シス テム 設計 者 や 隣接 モジ ュー ル の 担当 者 

と よく 打ち 合わ せま す . これ ら の 事項 が 最初 か ら 明確 に 分 

か ら な い 場 合 や , 設計 途中 で 変更 が 入る よう な 場合 も あり 

ます が , た と え 大 ざっ ぱ で も 決め る こと が 重要 で す . こ 

こと が 演算 回 路 本 体 を どの よう な 方 向 性 で 作る か に , 非常 
に 大 きく 影響 する か ら で す . 
また , 何 も 考 え ず に 演算 回 路 本 体 だ け 先 に 作る と , 周辺 

回 路 と うま くつ な が ら な い , 性 能 を 全く 発揮 で き な い と 

いっ た 深刻 な 問題 が 後 で 発生 に や すく な り ま す . 例え ば 

1 クロ ッ ク に 1 個 , 必ず 入力 デー タ が 来る と いう 想定 で 必 

要 性 能 が 得 ら れる よう 演算 アル ゴリ ズム な ど を 選定 し た の 

に , 実 シ ステ ム で デー タ ・ レート が 大 幅 に 低い こと が 後 で 

発覚 し た りす る と , アル ゴリ ズム 変更 が 必要 に な っ て 設計 

が 完全 に や り 直し に な っ て し まう か も し れ ま せん. 


人 @ 設計 コン テス ト の 芽 眼 点 

と ころ で , 「 Design Wave 設 計 コ ン テ ス ト 2007」 の 課題 
は 64 点 高速 フー リ 工 変換 FEFT ) 回 路 で す が 9, この 場合 
も 単に 汎用 FFT 回 路 の 最適 化 ば か り に 目 を 向け て は 面白 
く あ り ま せん . FEFT が どの よう な 用 途 で 使わ れ て お り , そ 
の 用 途 で は どれ くら い の 演算 精度 や 回 路 性 能 が 必要 な の か 
を 調べ て み ま し ょ う . 何 か 面白 い 特定 用 途 向 け に , ユニ ー 
ク な 計算 アル ゴリ ズム や 回 路 構成 を 考え て みる と , 際 だ っ 
た 特色 や 高い 実用 性 を 示す こと が で きる に 違い あり ませ ん . 
必ず し も 型 通り に バタ フラ イ 演算 を 行わ な く て も , 本 稿 で 
説明 する よう な 色々 な アイ ディ ア を 適用 する 余地 が 出 て く 
る か ら で す . 


(2 数式 を "その まま "実装 し な く て も よい 


目標 性 能 や イン ター フェ ー ス の タイ ミン グ が 見 えて きた 
ら , 仕様 の 計算 内 容 数 式 ) を どの よう な アル ゴリ ズム を 
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使っ て 作る か を 考え ま この と き の 基 本 的 な 発想 の 仕方 
は , 誤解 を 恐れ ず に 言え ば 


e 数 式 を その まま 正直 ( - 証 算 し な く て も よい 

e 数 学 的 に 複雑 な 計算 を 組む の は , な る べく 避け る ( バグ 
の も と ) 

e 精度 保証 が 必要 だ っ た り 例外 処理 の 多い 計算 方 法 は , な 
る べく 避け る テス ト が 大 変 ) 

な ど ,「 設計 の 労力 や 回 路 コ スト を いか に 少な く 済ま せる 

か 」 と いう こと で す . 
例え ば , FEFT 回 路 の 数 式 , 


(の = > x(⑰) 結衣 0 M 
寺 0 凶 
を も し 素直 に 計算 する な ら ば , まず 2z//) 太 を 計算 し , 次 


に e-9 2z7Wk を 計算 し , それ を 繰り 返す と いう 手順 に な り 
そう で す . また , 2 次 元 離散 コサイン 変換 DCT ) の 計算 式 , 


eo 半 人 62 


*COS 品 2 回 


た だ し , 4 8) は と =0 の と き 1/Y2, それ 以外 の と き 1 


san ( 2) 
涯 7) 


で あれ ば , cos 関 数 を 例え ば テイ ラー 展開 な ど を 使っ て 計 
算 し て いく の か も し れ ま せん し , 開平 計算 も 要り そう で す . 

し か し 通常 は , 以下 に 述べ る よう な 方 法 の も と で , も っ 
と 簡単 か つ 確 実に 回 路 が 作れ な いか , も っ と 回 路 性 能 が 得 
られ な いか と いう 点 に つい て 検討 を 行い ます 注 1. 


mm 


@⑯ オン ザ フ ラ イ 計 算 と 事前 計算 を 使い 分 ける 

回 路 実装 に 限ら ず ソ フト ウェ ア 実 装 で も 頻繁 に 使わ れる 
方 法 で す が , 難し い 演 算 に つい て は オン ザ フ ラ イ 計 人 算 回 
路 動 作 時 に リア ル タ イ ム で 計算 する こと ) を 行わ ず , 設計 
時 に 事前 計算 し た 結果 を テー ブル で 持っ て お く と いう 手法 
人 
値 な ど , テー ブル で 持つ こと に する だ け で 設計 は グッ と 楽 
に な り ま す . 別途 テー ブル 値 を 作成 ・ 検 証する 手間 は か か 
り ま す が , 込み 入っ た 回 路 を 作る より は 楽 で す . 

テー ブル は , HDL の case 文 で 書い て , 論理 合成 で 組み 


注 1: 一 般 的 な 傾向 と し て , 算術 演算 関数 を 数学 の 教科 書 に ある 定義 ・ 定 理 
通り に 計算 する と , 回 路 が 著しく 複雑 に な る , 性 能 が 低下 する , 精度 
保証 が 難し く な る , と いっ た 問題 が 起こ り がち. 数学 の 教科 書 で は そ 
うい っ た 工学 上 の コス ト 概念 を あま り 扱わ な い の が , 一 つの 理由 . 


事前 計算 し た 値 cos) 図 


(ang1e ) 
: COBYVa 
: COBYVa 
: COB8Y& 
: COB8Y& 
: COB8YVa 
: CO8YVa 
: COBSY& 
: COSY& 
: COBVa 
: COBVa 
: CO8YV& 


!d9630: 
1d7438: 
1d5062: 
1d2563 : 
!d0: 


endcage 


図 3 

事前 計算 結果 の 実装 形態 

事前 計算 し た テー ブル を 使う こと で 
回 路 構成 の 簡単 化 や 回 路 作成 の 手間 
の 削減 が 可能 . テー ブル の 実装 の 仕 
方 は いく つか あり , 一 長 一 短 . 


合わ せ 回 路 化 し た り , RAM や レジ ス 人 気 フリ ッ プ フロ ッ プ ) 
を 用 意 し て CPU に 値 を セッ ト し て も ら う , な どの 実装 方 法 
が あり ます . テー ブル 値 は 0 て 数 クロ ッ ク で 取り 出せ ます . 
た だ し , テー ブル 利用 に は 次 に 示す 注意 点 も あり ます . 
一 つの テー ブル に 持て る 要素 数 は た か だ か 22ー 219 個 租 
度 . 気軽 に 利用 で きる 目安 は 2# 個 くら いま で 
e オ ン ザ フラ イ 計 算 し た 方 が , 回 路 性 能 が 良い 場合 も 少な 
く な い 論理 演算 の 塊 の よう な 場合 な ど ) 
e オンザ フラ イ 計 算 と テー ブル 利用 の どちら が 性 能 上 有利 
か は , ソフ ト ウェ ア の 場合 と 必ず し も 同じ で は な い . 特 
に , ソフ ト ウェア と 異な り , 事前 計算 し た か ら と いっ て 
速く な る と は 限ら な い ハー ドウ ェ ア で は 複数 の 計算 を 
並列 実行 で きる た め ) 
また 実 設計 で は , オン ザ フ ラ イ 計 算 と テー ブル を 組み 合 
わせ た り , 複数 の テー ブル を 組み 合わ せ た り する こと も 珍 
し く あ り ま せん . 参考 文献 1),( 11)^( 14) の 高速 除算 回 
路 な ど が 面白 い の で , 参照 し て くだ さい . 


ツジ 


人 @ 数 体系 ・ 数 表現 を 変換 し て 演算 を 簡単 に する 

数 体系 を 変換 する こと で , 同じ 演算 で も か な り 簡単 か つ 
効果 的 に 行え る よう に な る 場合 が あり まず 図 4). これ も 
回 路 の みな ら ず 普遍 的 に 使わ れ て いる 考え 方 で す . また 数 
体系 と まで 言わ な く て も , 同じ 数値 を どの よう に 2 進 表現 
する か も 回 路 性 能 に 大 き な 影 響 を 与え ます . 


!d16384 
!d16182 , 
!d15582 
!Q14598 : 


'd13254 : 
'd11585: 


オン チッ プ RAM 


e あま り 少 な い エ ント リ 数 の RAM は な い 凶 
e チ ッ プ 化し た 後 で も 修正 で きる 図 
e CPU に 初期 設定 し て も ら う 必要 が ある 較 


e 性 能 は わり と 良い 図 
e バ ッ ク エ ンド 工程 配置 配線 以降 ) に 回 っ た 後 で は 修正 が 大 変 較 
e ゃ チッ プ 化 し た 後 で は 修正 で き な い 較 


オン チッ プ ・ マ スク ROM 


* あま り 少 な い エ ント リ 数 の ROM は な い 図 
e バ ッ ク エ ンド 工程 配置 配線 以降 ) に 回 っ た 後 で も 修正 が 効く 図 
ゃ チッ プ 化 し た 後 で は 修正 で き な い 較 


ANS = AXBXCXD…X タ : 


! 


乗算 より も log の コス ト が 図 
低けれ ば , こち ら の 方 が よい 図 


この 例 は , 整数 に 
つい て は 効果 が な い 


a+ DD+ C+ d+ の" 


+ 乙 』 


1og (ans) 


図 4 数 体系 や 数 表現 を 変換 し て 処理 を 簡単 に する 


図 の 例 は , デー タ が 整数 な ら ば あま り 効果 が な いも の の , 有限 体 な ど 整 数 以 
外 で は 有効 な 場合 が ある . log が 変換 関数 で ある . 図 と 同じ 考え の も と , な 
ん ら か の 変換 を 行っ て か ら 本 来 や り た か っ た 演算 を 行う こと は よく ある 


その よう な 例 は 無数 に 知ら れ て いま す が , 例え ば , 
eFFT な ど に よっ て 時 間 領 域 か ら 周波 数 領域 に 移す こと 
で , 周波 数 制御 , デー タ 圧縮 , デー タ 特徴 抽出 な ど を 容 
易 に する FFT は , それ 自体 が 目的 と いう より , これ ら 
多く の 用 途 に 使わ れる 1 部 品 ) 

e 画像 の 座標 系 変換 や ハフ 変換 な ど に より , 回 転 な どの 画 
像 操作 や 特徴 検出 を 容易 に する 

e 整数 に お いて , 基数 を 変換 し た り 冗長 2 進 表現 な ど を 用 
いた り し て 演算 コス ト を 低減 する . RSA 演算 に お ける モ 
ン ゴ メリ 変換 8L9 も 同様 の 目的 

e 有限 体 や ベク トル ・ デ ー タ な ど に お いて , 基底 変換 を 
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関数 70 


難し い 関 数 h を , 図 


関数 70 て 妨 ま た は g0 一 g7 を 図 


固定 小数 点数 newva1, o1dva1 : 


/* 値 が 収束 する まで ルー プ */ 
while ( 思 5I(newvannoPGvanzlbhreshena) { 
o1Qava1 = newva] 


newva1] = 丸め (演算 関数 (o1dva1 ) ) : 


) 


ェ return (newva1 ) : 


【 問題 点 】 較 
デー タ に よっ て ルー プ 回 数 が 異な る の で 図 
e 最悪 処理 時 間 を 保証 し に くい 較 
e パイ プラ イン 化 な ど 並 列 化 を 図り に くい 凶 
e 誤差 を 保証 し に くい 図 
( ルー プ に より 丸め 誤差 が 累積 ・ 拡 大 ) 図 


図 6 収束 アル ゴリ ズバ 河 近 法 ) に よる 計算 は な る べく 
避け る 

ニュ ー ト ン ・ ラ プ ソ ン 法 や テイ ラー 展開 な ど , デー タ が 収束 
する まで 繰り 返し 計算 を 行う よう な タイ プ の 処理 は , 図 に 示 
し た 問題 点 を 解決 で き な い 限り は 使用 を 避け た ほう が 無難 . 


組み 合わ せ て 模 信 し た い 図 
LM 
ブフ 
・ * 誤差 が 累積 凶 | 
e 誤差 保証 が 大 変 区 1) 1 ! 
関数 e 高速 較 
e 誤差 保証 し や すい 較 
| i | 
( a) 直列 図 ( b) 並列 図 


図 5 近似 計算 する と き は 用 いる 関数 を 並列 に 並べ る 


一 般 に , 関数 を 直列 に すれ ば する ほど , 速 具 レイ テン シ ジ ) が 遅く な る と と も に 精度 保証 も 難し く 


な る . 


行っ て 演算 コス ト を 低減 すず 5 
な ど が 挙げ られ ます . 効果 の 程度 を 一 般 的 に 言う の は 難し 
いで す が , 演算 速度 や 回 路 規模 が けた オー ダ で 劇 的 に 改善 
する よう な こと は し ば し ば あり ます . 

な お , 変換 ・ 逆 変換 に は オー バ ヘ ッ ド が 付き も の で す . 
その た め , 変換 に よっ て 回 路 コ スト が 増加 する 場合 も ある 
の で * ゆ 2 それ で も 変換 の メリ ッ ト が ある か を 見 極め る 必要 
が あり ます . 


人 @ 近似 計算 する 

高度 な 関数 を その 通り 計算 する の で な く , 多項式 関数 な 
ど を 組み 合わ せ て 近似 計算 する 方 法 も し ば し ば 使わ れ ま 
ず 1 て 9。 近似 に 用 いる 関数 群 を , な る べく 直列 で は な 
く 並列 に 並べ る よう に する の が 工夫 の し どこ ろ で ポポ 図 5). 
回 路 を 高速 化し た り 精度 を 保証 する と いう 点 で 好都合 だ か 
ら で す . 

この 方 法 で は , 近似 の 方 法 に も より ます が , 精度 保証 が 
難し い 問 題 に な る こと が あり ます . 特に テイ ラー 展開 や 
ニュ ー ト ン ・ ラ プ ソ ン 法 な ど , 繰り 返し 計算 で 値 を 収束 さ 
せ て いく アルゴ リズ 潤 近 法 ) も 一 種 の 近似 計算 で す が , 
回 路 化 に は 次 の よう な 問題 点 が あり ます . 解決 で き な い 限 
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り は 避け る 方 が 無難 で ず 図 6). 

e 繰り 返し に よっ て , 途中 結果 の 保存 に 必要 な ビッ ト 数 が 
極端 に 増加 し て いく こと が ある ( 例え ば 乗算 を 繰り 返し 
た 場合 な ど ) 

回 路 コ スト を 抑え る た め , ある い は 循環 小数 を 打ち 切る た 
め に 途中 結果 を 丸め る と , 今度 は 最終 結果 の 精度 保証 が 難 
し く な る . 繰り 返し 処理 に よっ て 丸め 誤差 が 拡大 ・ 累 積 す 
る が , その 様子 を 解析 する の は 一 般 に は 簡単 で な い 

e 入力 デー タ 値 に 依存 し て 処理 時 間 繰り 返し 回 数 ) が 変わ 
る の で , イン ター フェ ー ス の タイ ミン グ 設 計 や , デー タ 
処理 の 最低 性 熊 値 が 収束 する まで の 最大 繰り 返し 回 数 ) 
の 保証 が 難し い 


@ 計算 量 の 少な い ア ル ゴ リ ズム を 使う 

元 の 数 式 通り に 計算 する の で は な く , より 計算 量 オー 
ダ ) の 少な い ア ル ゴ リ ズム を 合う 方 法 が あり ます . これ も 
演算 処理 ご と に 多数 の 研究 ・ 調 査 が が され て いま す . 例え 
ば , 第 1 章 で 述べ た FFT に つい て は 参考 文献 3) を , リー 


注 2: 例え ば , FFT を か ける こと に よっ て デー タ は 複素 数 に な る し , 変換 前 
後 で の デー タ の ビッ ト 幅 な ど に も 慎重 な 気配 り が 必要 に な る . 変換 ・ 
逆 変換 時 に 丸め な ど を 行う な ら , 情報 だ が ロス し な いか に も 注意 が 必要 


入力 デー タ 
図 7 時 鹿 O ーー ーー 四 証 | 画 
デー タ を 連続 的 に 投入 で 時 刻 1 ロ ーー コ 古 后 環 豆 
きる よう に する の が 回 路 時 刻 2 ロロ ロー 
高速 化 の 常 と う 手 段 時 刻 3 ピー 面 語 
計算 量 の 少な い ア ル ゴ リ ズ 時 刻 4 ゴゴ 
ム を 使っ た と し て も , 一 つ 時 刻 5 


デー タ を 入れ た ら 処理 が 終 
わる まで 完全 だ ん まり 」 
に な っ て し まう 回 路 で は , 
それ ほど の 処理 性 能 は 出 な 
い . デー タ を 連続 投入 で き 
る よう に する 方 法 は 大 きく 
分 け て 二 つ あ る . 一 つば 8a) 
に 示す パイ プラ イン 化 で , 
直列 に つなが っ た 処理 に お 
いて , デー タ を 次 の 処理 に 
回 し たらす ぐ 次 の デー タ を 
受け 付け る よう に し た も の . 
も う 一 つば b) の イン ター 
リー ブ 化 で , 処理 モジ ュー 
ル を 並列 に 並べ て , 空い て 
いる モジ ュー ル に デー タ を 
投入 する よう に し た も の. 


し LS ]| | | 還 還 間 男 呈 較 


ド ソ ロモ ン 符 号 に つい て は 参考 文献 6) を , RSA 暗号 に つ 
いて は 参考 文献 7)< べ 9) を 手がかり に し て 調べ て みて く 
だ さい . 

た だ し , 計算 量 が 少な いと 回 路 が 高速 に な る ( ある い は 
回 路 が 小 規模 に な る ), と は 単純 に は 言え な い の で 注意 が 
必要 で す . 計算 量 は , ソフ トウ ェ ア の よう 演算 を 1 ス 
テッ プ ず つ 逐 次 順番 に ) 実行 し た と き の 時 間 ま 3j を 表す 指 
標 な の で , 並列 処理 が 可能 で 演算 コス ト も 異な る ハー ド 
ウェ ア に は 当て は め ら れ な い の で ず 9⑨. 詳細 に つい て は 誌 
面 の 都合 上 , 解説 を 割愛 し ます . 


⑯ ソフ トウ ェ ア の 高速 化 手段 を 使え な いこ と が ある 
計算 量 の 少な い ソ フト ウェ ア 用 アル ゴリ ズム で は , 次 の 

よう な 高速 化 手段 が 頻繁 に 使わ れ て いま す . 

e メ モリ 上 に 複雑 な デー タ 構 世 木 構造 , 各種 リス ト , テ 
ー ブ ル な ど ) を 構築 する 

e それ を 動 的 に 頻繁 に 更新 する 

e 関数 の 再帰 呼び 出し 


厳密 に は 時 間 だ け で は な く , 領域 メモ リ ) の 話 も ある が , ここ で は 割 
愛す る . いずれ に し て も , 計算 量 と いう の は 基本 的 に チュ ー リ ング ・ 
マシ ン 上 の 概念 で ある か ら , 回 路 の よう に 自由 な アー キテ クチ ャ 上 で 
処理 を 実行 で きる 場合 に は , 当然 , 当て は ま ら な く な る . 

回 路 処理 や 回 路 構造 な どの 細か さ 」 の こと . 直感 的 な 例 を 示す と , 
個々 の 論理 演算 より は 整数 演算 の 方 が 処理 の 粒度 が 大 きい . 論理 ゲー 
の 組み 合わ せよ り は , ブロ ッ ク 図 の 方 が 構造 の 粒度 が 大 きい . 


注 3: 


注 4: 


川 用 


( b) イン ター リー ブ 処 理 の 導 空間 並列 ) 図 


これ ら の 手法 は 普通 の RTL と し て 記述 で きま せん . ま 
た , トリ ッ キ ー な 方 法 で 無理 に 回 路 化 し て も , それ ほど の 
高速 作 に つなが る わけ で は あり ませ ん . これ も 詳し い 説 明 
は 割愛 し ます が , 参考 文献 2) な ど を 参照 し て くだ さい . 


人 @ 高速 化し た けれ ば デー タ を 連続 処理 で きる よう に する 

も し , デー タ 処 理 の 高速 化 が 必要 な の で あれ ば , 計算 量 
を 減ら すこ と より も , デー タ を 連続 投入 で きる よう な 処理 
構成 を 考え る こと か ら 検 討 する の が 先決 で す . いろ いろ な 
粒度 まで パイ プラ イン 化 を 図る , イン ター リー ブ な ど に よ 
る 処理 並列 化 を 図る , な ど が 最も 基本 的 な 手法 で す . 図 7 に 
それ ら の 概要 を 示し ます . 

具体 的 な 回 路 が も う 少し 見 える 例 と し て , 1 クロ ッ ク に 
1 デー タ と いう 速度 を 達成 し た 1 次 元 DCT 回 路 の 例 を 図 8 
に 示し まず DCT で は これ が 標準 的 な 回 路 構成 ). 発想 
は イン ター リー ブ と 似 て いま す . まず , シリ アル に や っ て 
くる デー タ を ヵ 並 列 処理 する こと で , 1 回 路 ユ ニッ ト 当 た 
り の デー タ 速度 を 1/ ヵ に 落と し , その 後に パラ レル - シ リア 
ル 変換 で デー タ ・ レ ー ト を 元 の 速度 1 クロ ッ ク に 1 デー タ ) 
に 引き 上 げ て いま す . 


人 @ 演算 順序 や デー タ ・ ア クセ ス 順 を 工夫 する 
や や 細か い テ クニ ッ ク で す が , 数 式 の 計算 回 路 で は 次 の 
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図 8 
デー タ の 連続 投入 が 可能 な 


入力 デー タ 較 
( 1 クロ ッ ク に 1 デー タ ) 図 


1 次 元 離散 コサイン 変換 回 路 

の 例 

図 は 1 次 元 DCT 回 路 の 標準 的 な 

の 詳細 は 省略 する 
ポイ ント は 二 つ . 一 つ は 計 


AM 並列 化し や すい アル ゴリ gd その ェ ラン 2 ミニ 


ズム を 使う こと . も う 一 つ は パラ 
レル - シ リア ル 変 換 に よっ て デー 
タ 幅 を 広く する 代わ り に デー タ 速 
度 を 落と し た り , シリ アル - パ ラ 
レル 変換 に よっ て デー タ 幅 を 狭く 
する 代わ り に デー タ 速度 を 上 げた 


り , と いう 速度 調整 を 行う こと . 1 
例え る と , 川 の 水 の 流れ の 調節 出力 デー タ 図 
と 同じ よう な こと で ある . ( 1 クロ ッ ク に 1 デー タ ) 図 


よう な 方 法 が 基本 的 な 最適 化 法 と し て よく 使わ れ ま ず ? 

( 図 9). 

* 式 を 展開 し た 後に 
演算 を 減ら す 

e 共通 項 を 抜き 出し て 繰り 返し 計算 を 減ら す 

e 式 の 深 さ が 減る よう 式 変形 し て 高速 化す る 

e 複数 の 式 の 間 で 演算 器 を 使い 回 が や り 過ぎ は 人 禁物) 
ゲー ト ・ レ ベル の 最適 化 は 粒度 が より 細か い の で す が , 
考え 方 は 多く の 点 で 同じ で す . 


AX 4XC 障 AX(C B 寺 C) 図 


( a) 式 を 変形 し て 重い 演算 乗算 な ど ) を 減ら す 凶 


因数 分 解す る な ど , 式 を 変形 し て 重い 


{4) 二 9@【 A) ) は 下 の よ うな 回 路 に する 


何 回 も 《 4) を 計算 し な いで 使い 回 し 図 


ーー 


( b) 同じ 計算 の 繰り 返し を な くす 較 


(( AX )XC)X り 謙 AX)x( CX ワ ) 図 
( た だ し , 4 て り の 値 が 同時 に 決ま る 場合 ) 凶 


( c) 式 変形 し て 深 さ を 減ら す 較 


図 9 数 式 を 回 路 化す る 上 で の 小 技 
図 に 示し た の は , いずれ も 非常 に よく 知ら れ た 常 と う 手段 で ある . 組み 合わ 


せ 回 路 だ け で な く 順序 回 路 で も 適用 で きる が , その と き は 高速 化 と 回 路 規模 


の トレ ー ド オフ の 問題 が より 鮮明 に 出 て くる . 
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並列 図 積 和 算 較 積 和 算 較 積 和 算 図 
アキ ュ ム レー タ 刷 アキ ュ ム レー タ 還 アキ ュ ム レー タ 隔 


…・ 必 積 和 算 較 
アキ ュ ム レー タ 了 


,7 ク ロッ ク に 区 
” 1 デー タ 図 


シフ ト ・ レ ジス タ 図 
( パラ レル - シ リア ル 変 換 ) 図 


また , 回 路 へ の デー タ の 入力 順 デー タ の アク セス 順 ) の 
工夫 も , 回 路 規模 の 削減 や 速度 の 向上 に 効果 が あり ます . 
ご く 単純 な 例 と し て は 次 の よう な も の が 挙げ られ ます . 

e 入力 デー タ を た め ず に 到着 し だ い 処 理 を 進め られ る よう , 
回 路 の イン ター フェ ー ス ・ プ ロト コル を 設計 する . 例え 
ば , 受け 取っ た デー タ の CRC 値 を 確認 する と き な ど 17, 
送信 時 に CRC を 計算 し た と き と 同 じ 順番 で デー タ を 流し 
て も ら う よう に する . そう し な いと , 多量 の バッ ファ ・ 
メモ リ が 必要 に な る 多く の ECC で も 同じ ) 
画像 処理 に お いて , 画面 走査 順 な ど を 工夫 し て 画素 参照 
回 数 を 減ら せる 場合 が ある 


人 @ 適切 な 抽象 度 を 選択 し て 設計 する 

一 般 論 と し て ば 設計 は な る べく 高い 抽象 度 で 行う 方 が 
よい 例え ば ゲー ト ・ レ ベル より は RTL, RTL よ り は ビ ヘ へ 
イ ビ ア ・ レ ベル )」 と 言わ れ ま す が , それ は あく まで 十分 な 
性 能 を 達成 で きる 場合 の 話 で す . ハー ド ウェ ア 設 計 , 特に 
演算 回 路 設 計 に お いて は , 高い 抽象 度 で は 必要 な 性 能 が 出 
な い 場 合 が 頻繁 に あり ます . 

し か も , 高い 抽象 度 で あれ ば どん な 処理 で も 簡単 に 作れ 
る の か と いう と , そう で も あり ませ ん . 高い 抽象 度 の プリ 
ミ テ ィ ズ 関数 や 記述 法 ) し か 使え な い 状 況 で は , 低い 抽象 
度 な ら 簡単 に 済む 処理 の 記述 が , 非常 に 回 りく どく な る 場 
仙 和 の 0 で す . 

例え ば 画像 加工 で は ,「 ある し きい 値 より 暗い と ころ で 
は フィ ル タ 値 ん を, 明る いと ころ で は フィ ル タ 値 B を 適用 」 

と いう アダ プティ ブ な 処理 な ど を , 自分 専用 に きめ 細か く 
工夫 し て 使う こと が よく あり ます . と ころ が , モデ リン 
グ ・ ツ ー ル に は 全 画 面 に 同一 フィ ル タ を か ける 」 よ うな 一 


有限 体 GR 24) の 乗算 器 の Verilog HDL 記述 . 較 
ゲー ト ・ レ ベル だ が 規則 性 も あり 容易 に 作れ る . 図 
出来 上 が る 回 路 も 高 性 能 . 較 


asstgn a0b0 = a[O] & b[0]: 
as8ign a0b1] = a[0] g b[1]: 
…( AND 記 述 13 行 省略 ) … 

as81gn a3b3 = a[3] & b[3]: 


tei0) 
で 1 
で 2 
で 3 
で 4 
C5 
Cc6 


a881qdn 
a881qdn 
a881g9n 
a8819n 
a8819n 
a881qdn 
a881qdn 


a0b0: 
a0b1 
a0b2 
a0b3 


o[0] 
O [11 
o[2] 
Oo [3] 


a881d9n 
a881qdn 
a881qdn 
a8819n 


( a) 論理 演算 を 使っ て 組ん だ 回 路 較 


論理 演算 を 一切 使わ ず に 作ろ うと する と , それ ほど 簡単 に は 書け な い . 
剰余 算 な ども 必要 に な っ て 回 路 性 能 も 大 幅 悪化 . 較 


case (a) /* べき 表現 に */ 


4d0: ap = 
4d1: ap = 
4d2: ap = 
4d3: ap = 


4 劉 5. ap 
de Fau1t : 
end Ca8e 


4'd0: 4d0: bp = 4d0: 
4'd0: 4q1: bp = 4d0: 
4'd1: 4d2: bp = 4d1: 
4'd4: 4d3: bp = 4d4: 


4'd12: 
ap = 4d0: 


4 競 5.。 


end coa8e 


case (ad) /* ベク トル 表現 に */ 


4 
4 


4 
4 


4 馬 4 


defau1: 


d0 : 
d1 : 
'd2 : 
"93 : 


= 4d1: 
= 4d2: 
= 49d4: 
= 4'd8: 


Oo1 
O1 
O1 
O1 


= 4'9d9: 
o1 = 4d0: 


O1 


end oag8e 


assign o= (a== 0 || b==0) ? 0 : 


図 10 「 高い 抽象 度 で コー ド を 書い た 方 が 簡単 」 と は 限ら な い 


図 は 有限 体 乗 算 の 例 . 一 般 に ば ゲー ト ・ レ ベル の 記述 は 難し く , RTL, ビヘイビア ・ 


じ ら れ て いる . し か し , 現実 は 必ず し も そう 単純 で は な い . 


@ 遇 j 


( b) 整数 演算 だ け で 実現 図 


bp = 49d12: 
defEau1t: bp = 490: 


レベ ル と 抽象 度 が 上 が る ほど 記述 は 簡単 で ある 」 と 信 
高い 抽象 度 で は , 整数 演算 や 処理 の コン ト ロー ル ( Fo や 1E な ど ) な ど は 確か 


case (b) /* べき 表現 に */ 


に すっ きり 書け る . と ころ が , 少し で も 記法 の 範囲 に な い 処理 を 書 こ うと する と , 高い 抽象 度 で ある 点 が 突如 と し て 厄介 な 足かせ に な っ て 


し まう . ポイ ント は , 高い 抽象 度 で 回 路 を 書く こと で は な く , 
般 ニ ー ズ の 高い プリ ミ テ ィ ブ 関数 し か 用 意 さ れ な い の が 普 
通 で , それ を 使っ て 上記 処 理 を 組む の は と て も 面倒 な こと 

に な り ま す 往 5. 少し 抽象 度 を 下げ て 〇 言語 な ど で 組め ば ぱ ば, 
きめ 細か い 処 理 を 書け る の で 人 造作 も あり ませ ん . 

さら に 回 路 に 近い 例 と し て , 図 10 に エラ ー 放 正 符号 な 
ど で よ く 使わ れる , 有限 体 の 乗算 回 路 の 例 を 示し まず ら ". 
図 1G a) は 論理 演算 を 使っ て 普通 に 組ん だ 回 路 で す . それ 
ほど 複雑 な も の で は あり ませ ん し , 規則 性 も ある の で 作成 
は いた っ て 簡単 で す . し か し , これ を ソフ ト ウェ ア の よう 
こ 整 数 演算 だ け で 書 こ うと する と , 図 10 b) の よう 有 
限 体 か ら 整数 へ 数 値 体 系 を 変換 し , 整数 上 で 演算 を 行い , 
その 結果 を 有限 体 へ 送 変換 する 」 と いう 面倒 ぶ こ と に な り 
まず 実際 に こよ る 実装 で は よく 見 か ける 記述 ). 回 
路 性 能 は 図 16 a) と は 比較 に な ら な い ほ ど 悪 化し ます . 


言語 に 


言語 t 


ロ 


注 5: 例え ば , 全 画 面々 に フィ ル タ 4 を か けた 結果 2 と フィ ル タ を か けた 
結果 ヵ を 両方 作り , し きい 値 に よる の 2 値 化 結果 を 作り , ay 十 py 

を 計算 する , な ど . 回 りく どい こと この うえ な いし , うま く 書け な い 

こと も し ば し ば 


本 稿 で は 
細 使わ れ て いる 考え 方 を 紹介 し まし た . 


は , 


0 方 が ある は ず で す . それ は 実務 を 
く の が よい で し ょ う . 筆者 の 経験 と し て 
は 書籍 や 本 稿 !?) を 


適切 な 抽象 度 を 選ん で 書く こと で ある . 


, 演算 処理 回 路 の 設計 に 


お いて , お お よそ 普遍 


も ちろ ん 現実 に 


設計 対象 や 会 社 の 事情 お かど に よっ て , さま ざま な 工夫 


も り に 
こと が 肝心 で す . 


一 見 つま ら な そう に 見 える こと が , 


読ん だ り , 
な っ て いて も 駄目 で , 実際 に 


通し て つか ん で い 
は , 演算 回 路 設計 


人 の 話 を 聞い て 分 か っ た つ 
自分 の 手 で や っ て みる 


案外 難し か っ た り 重 


要 で あっ た りす る か ら で す . 
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6 
| 銘 生 aeW 
( 第 1 章 の コ 9 の つづ き . ) 要求 仕様 を きち ん と 理 
の 全体 像 が まとまっ た ら , 次 の よう な 工程 に 進み ます . 
手順 6) 基本 設計 書 を レビ ュー する 
どの よう な 処理 を 実現 する 回 路 を 作る か , どの よう な イン ター フェ 
に する か , どの よう な ブロ ッ ク 構 造 に する か , な ど を ド キュ メン 
ト 化し て , 依頼 者 を は じ め 関 係 者 と レビ ュー し ます . ここ で の 徹底 的 
な 確認 が 非常 に 重要 で す . 回 路 規模 や 必要 な コン ポー ネン ト ( オン チ 
ッ プ RAM や カス タム ・ マ クロ な ど ) の 予測 も 伝え ます . 
手順 7) 設計 環境 や 検証 環境 を 構築 する 
EDA ツー ル の セッ ト アッ プ 作 業 の みな ら ず , どの よう な 戦略 で 設 
計 や 検証 を 進め る か を よく 相談 し て 決定 し ます . 設計 や 検証 の 専用 


ツー ル を 作る 場合 も し ば し ば あり ます . 
手順 8) RTL を 書い て , まず 設計 者 が 検証 する 


詳細 は 省略 し ます . 一 通り RTL が 出そろう まで の 期間 は , 案外 短 
こと ( 例え ば 1 週間 1 カ月 な ど ) が 多い で す . 
順 9) コ ー デ ィング の 結果 を レビ ュー する 
設計 チー ム の メン バ で , ソー ス ・ コード を 実際 に 見 て 問題 を チェ ッ 
ク し ます . 
手順 10-1) 論理 合成 な ど を 通し バッ クエ ンド に 回 す 準 備 を 行う 

ここ か ら が 実に 長い 道のり に な り ま す . 論理 合成 で 動作 周波 数 が 
出 な い , 回 路 規 模 が 大 き 過 ぎる , RTL 対 ゲー ト の 等 価 性 検証 が うま 
く で き な い な ど , 慎重 に 設計 し た つも り で いて も 問題 は た くさ ん 起 
きる も の で す . な お , 論理 合成 な ど は いつ も 設計 者 自ら が 行う と は 
限ら ず , 別 部 門 や 列 会 社 が 行う こ こと も あり ます . 


34 Design Wave Magozine 2007 Janugary 
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も りお か ・ す みお 
日 本 電気 株 ) シス テム デバ イス 研究 所 


手順 10-2) 検証 プラ ン を レビ ュー する 

これ まで の 作業 に 並行 し て , 検証 者 の 方 で は 検証 プラ ン を 立て て 
検証 仕様 書 を 書き , 自動 検証 環境 リグ レッ ショ ン 可能 ) な ども 作っ 
て いま す . これ を レビ ュー し ます . 
手順 10-3) 検証 者 に 引き 渡し て 念入り に テス ト 

シミ ュ レ ー タ だ け で な く FPGA な ども 導入 し , と に か く 念 入り に 
検証 を 行い ます . チッ プ 化 する 回路 の 検証 で 流す パタ ー ン 数 は , 数 
百 万 数 億 と いっ た オー ダ で ず それ で も 完全 で は な い ). バグ 発見 
時 の 修正 ・ 再 検証 も 含め て , 完了 まで に 数 カ月 か か る こと は ざら に 
あり ます . 
手順 10-4) シ ステ ム に 統合 し て 全体 検証 

IP コア を シス テバ ( チッ プ ) 全体 に 組み 込ん で の 検証 も 進め ます . 
シミ ュ レ ーション で は 手 に 負え ず , 巨大 な FPGA ボー ド を 使う こと 
が よく あり ます . 
手順 11) バッ クエ ンド 部 隊 に 引き 渡す 
配置 配線 な どの 作業 チー ム に 設計 デー タ を 引き 渡し ます . た だ し 
上 記 の 検証 作業 が 完全 に 終っ て いな く て も ,「 仮 デ ー 9 し て 価 度 
か 事前 に 流す こと も あり ます . ATPG チッ プ の 製造 日 の デ 
タ 生 成 ツ ー ル ) で テス ト ・ カ バレ ッ ジ が 足り な い , 0 
周波 数 が 悪化 し た , な ど 相 変わ ら ず 問題 は 出 て きま す . 
手順 12) チップ が 完成 する ( 本 当 に 怖い の は ここ か ら ) 

チッ プ が 出来 上 が っ て 製品 に 搭載 され て 世の中 に 出 て いく の は , と 
て も うれ し い 体 験 で す . 反面 , も し バグ が 発見 され た ら と 思う と 冷 
や 汗 が 出 て きま す が , 筆者 は 幸運 に も その 経験 は あり ませ ん . 


